¿Cúal es el precio de las casas respecto a la puntuación recibida ?

Obtener muestra de 50 registros.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  180000  296138  486500  532539  659375 2000000
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5.00    7.00    7.00    7.48    8.00   11.00

Filtrado : df <- df %>% filter(price < 2000000)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  180000  291850  485000  502590  650000 1350000
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   5.000   7.000   7.000   7.449   8.000  11.000

Pruebas de normalidad de shapiro-wilk y comprobación visual

Usando hist() y shapiro.test()

Shapiro.test prueba que la distribución de una variable es normal estadisticamente, si p-value es mayor a 0.05. Esta prueba se utiliza para una muestra de menos de 50

shapiro.test(subdf$price)
## 
##  Shapiro-Wilk normality test
## 
## data:  subdf$price
## W = 0.90242, p-value = 0.0006599
shapiro.test(subdf$grade)
## 
##  Shapiro-Wilk normality test
## 
## data:  subdf$grade
## W = 0.86462, p-value = 4.63e-05

Pruebas de correlación (estadistica)

# prueba de correlación de variables, su valor deberia ser cercano a 1
cor.test(subdf$grade,subdf$price, method= "pearson")$estimate
##       cor 
## 0.7154888

Correlación positiva entre la puntuación y el precio de una casa

En medida de que la puntuación es mas alta, los precios de las casas aumentan, se considera que la correlación es tipo positiva y moderada.

Distribución en $